মেশিন লার্নিং প্রজেক্ট উদাহরণ

বাস্তব উদাহরণ এবং প্রজেক্ট ডেমো - পাইথন কৃত্রিম বুদ্ধিমত্তা (Artificial Intelligence with Python) - Machine Learning

339

এখানে একটি সাধারণ মেশিন লার্নিং প্রজেক্ট উদাহরণ আলোচনা করা হবে, যা একটি Classification সমস্যা সমাধান করবে। প্রজেক্টটি আমরা Iris Dataset ব্যবহার করে তৈরি করব এবং Scikit-learn লাইব্রেরি দিয়ে মডেল তৈরি করব।

প্রজেক্ট: Iris Flower Classification

Iris Dataset হল একটি বিখ্যাত ডেটাসেট যা বিভিন্ন ধরনের Iris ফুল এর বৈশিষ্ট্য নিয়ে তৈরি। এটি ৪টি বৈশিষ্ট্য (sepal length, sepal width, petal length, petal width) এর উপর ভিত্তি করে ফুলের ৩টি ভিন্ন প্রজাতি (setosa, versicolor, virginica) শ্রেণীবদ্ধ করা হয়।


প্রজেক্টের ধাপসমূহ

  1. ডেটা লোড এবং প্রাক-প্রক্রিয়া (Data Loading and Preprocessing)
  2. ডেটা বিভাজন (Data Splitting)
  3. মডেল তৈরি (Model Building)
  4. মডেল প্রশিক্ষণ (Model Training)
  5. মডেল মূল্যায়ন (Model Evaluation)
  6. মডেল সংরক্ষণ (Model Saving)

1. ডেটা লোড এবং প্রাক-প্রক্রিয়া

প্রথমে Iris dataset লোড করা হবে এবং কিছু প্রাথমিক প্রক্রিয়া করা হবে যেমন ডেটার তথ্য পরীক্ষা করা এবং মিসিং ভ্যালু থাকলে সেগুলি পূর্ণ করা।

import pandas as pd
from sklearn.datasets import load_iris

# Iris ডেটাসেট লোড করা
iris = load_iris()

# ডেটা ফ্রেম তৈরি
df = pd.DataFrame(data=iris.data, columns=iris.feature_names)
df['species'] = iris.target

# ডেটার প্রথম কিছু সারি প্রদর্শন
print(df.head())

2. ডেটা বিভাজন

ডেটাকে প্রশিক্ষণ (training) এবং পরীক্ষা (testing) সেটে ভাগ করা হবে। সাধারণত ৭০%-৮০% ডেটা প্রশিক্ষণের জন্য এবং ২০%-৩০% ডেটা পরীক্ষণের জন্য রাখা হয়।

from sklearn.model_selection import train_test_split

# ডেটা এবং লক্ষ্য বৈশিষ্ট্য আলাদা করা
X = df.drop('species', axis=1)  # বৈশিষ্ট্য
y = df['species']               # লক্ষ্য

# ডেটা বিভাজন
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

3. মডেল তৈরি

এখানে আমরা একটি সহজ মেশিন লার্নিং ক্লাসিফিকেশন মডেল, Logistic Regression ব্যবহার করব। আপনি চাইলে অন্যান্য ক্লাসিফিকেশন মডেল যেমন Random Forest বা Support Vector Machine (SVM) ব্যবহার করতে পারেন।

from sklearn.linear_model import LogisticRegression

# মডেল তৈরি
model = LogisticRegression(max_iter=200)

# মডেল প্রশিক্ষণ
model.fit(X_train, y_train)

4. মডেল প্রশিক্ষণ

আমরা মডেলটি fit() ফাংশন দিয়ে প্রশিক্ষণ দিব। এখানে, X_train বৈশিষ্ট্য এবং y_train লক্ষ্য বা আউটপুট হবে। মডেলটি এই ডেটা থেকে শিখবে এবং একটি সিদ্ধান্তে পৌঁছাবে।

# মডেল প্রশিক্ষণ
model.fit(X_train, y_train)

5. মডেল মূল্যায়ন

মডেল প্রশিক্ষণ হয়ে গেলে, Accuracy এবং Confusion Matrix ব্যবহার করে মডেলটির পারফরম্যান্স পরীক্ষা করা হবে। এখানে accuracy_score এবং confusion_matrix ব্যবহার করা হবে।

from sklearn.metrics import accuracy_score, confusion_matrix

# পূর্বাভাস করা
y_pred = model.predict(X_test)

# Accuracy নির্ণয় করা
accuracy = accuracy_score(y_test, y_pred)
print(f'Accuracy: {accuracy * 100:.2f}%')

# Confusion Matrix
conf_matrix = confusion_matrix(y_test, y_pred)
print("Confusion Matrix:")
print(conf_matrix)

6. মডেল সংরক্ষণ

শেষে, মডেলটি সংরক্ষণ করা হবে যাতে পরবর্তীতে তা আবার ব্যবহার করা যেতে পারে, যেমন একটি ওয়েব সার্ভিস বা অ্যাপ্লিকেশনে ইন্টিগ্রেট করা।

import joblib

# মডেল সংরক্ষণ করা
joblib.dump(model, 'iris_model.pkl')

# মডেল পুনরায় লোড করা
loaded_model = joblib.load('iris_model.pkl')

উপসংহার

এই প্রজেক্টে আমরা Iris Dataset ব্যবহার করে একটি Logistic Regression মডেল তৈরি করেছি এবং সেটি প্রশিক্ষণ, মূল্যায়ন, এবং সংরক্ষণ করেছি। এই প্রজেক্টটি মেশিন লার্নিংয়ের মৌলিক ধারণা এবং স্কikit-learn লাইব্রেরি ব্যবহারের প্রাথমিক অভিজ্ঞতা প্রদান করে।

এই ধরনের প্রজেক্টে আপনি Supervised Learning মডেল তৈরির বিভিন্ন ধাপ, যেমন ডেটা লোডিং, প্রশিক্ষণ, পরীক্ষা, এবং মূল্যায়ন প্রক্রিয়া শিখতে পারেন।

Content added By
Promotion

Are you sure to start over?

Loading...